20.2.2 QLoRA와 GPTQ: 거대 모델의 효율적 파인튜닝과 배포